R语言

您所在的位置：网站首页 › 比较两组差异的p value › R语言

R语言

2024-07-17 18:17| 来源: 网络整理| 查看: 265

差异显著性检验是我们在分析数据的时候应用最多的统计学方法。

我们经常要比较两组或多组数据是否具有显著差异，同时我们还会用差异显著性检验识别不同组样品中具有显著差异的变量。

这篇推文会分别介绍经常使用的差异显著性检验方法在R语言中的实现。

方法选择

差异显著性检验具有多种方法，分别针对不同的情况，我们要根据自身情况选择合适的方法进行分析。

⚠️以上方法均为比较不同组数据见均值的差异显著性。

正态分布检验

可以看出在进行差异显著性检验之前，最重要的一步就是要评估数据是否符合正态分布。

QQ图

我们可以使用QQ图的方法来评估数据是否符合或接近正态分布。

QQ图是由观测值与按正态分布的预期值做出来的散点图，散点图组成的回归线越接近于标准线，表示实际观测数据越接近正态分布。

QQ图使用qqnorm和qqline两个函数完成，其参数比较简单，基本不需要修改和调整。

qqnorm(y, ylim, main = "Normal Q-Q Plot", xlab = "Theoretical Quantiles", ylab = "Sample Quantiles", plot.it = TRUE, datax = FALSE, ...)

各参数意义：

y为待分析数据；

ylim为y轴范围；

main为图像标题；

xlab和ylab为x和y轴标签；

plot.it是否要绘图；

datax是否数据值为x轴数据。

qqline(y, datax = FALSE, distribution = qnorm, probs = c(0.25, 0.75), qtype = 7, ...)

各参数意义：

y为待分析数据；

datax是否数据值为x轴数据；

distribution定义数据的参考理论分布；

probs为两个数字的向量，代表可能性；

qtype定义用于计算的分位数的类型。

使用一组随机数据绘制一个QQ图的示例。

x 0.05时，不能拒绝原假设，表明变量服从正态分布。

两组样本差异比较

确定数据是否符合正态分布之后，就可以对其进行组间差异显著性比较了。

t-test

当数据分为两组并且两组数据均符合正态分布时，使用t-test进行差异显著性比较，该分析由t.test函数完成。

t.test(x, y = NULL, alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, var.equal = FALSE, conf.level = 0.95, ...)

各参数意义：

x和y为待分析数据；

alternative规定检测的类型；

mu为原假设，即定义两组数据均值的假设差异；

paired是否进行配对检验；

var.equal定义是否检测两组方差的一致性；

conf.level为显著性等级。

⚠️t.test默认使用的是Welch t-test，该方法不要求比较数据方差齐性。

如果想要使用要求数据方法齐性的Student‘s t-test，需要把var.equal设置为TRUE。

方差齐性检验

方差齐性应用F-test进行检验，该分析由var.test函数完成。

var.test(x, y, ratio = 1, alternative = c("two.sided", "less", "greater"), conf.level = 0.95, ...)

各参数意义：

x为因变量数据；

y为响应变量数据；

ratio定义x和y方差的比值；

alternative定义检验的类型；

conf.level为置信水平。

t-test示例

随机生成两个向量数据进行t-test。

【本文地址】

R语言

R语言

今日新闻

推荐新闻